Aprendizaje por refuerzo con auto-juego bajo información imperfecta en Big 2 Aprendizaje por refuerzo y auto-juego en Big 2 con información imperfecta. Optimiza estrategias en juegos de cartas con técnicas avanzadas de IA. 2026-05-30 · 2 min